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Besct^reibung 

Verfahren zur Erzeugung eines Bitstroms aus einem Indizie- 
rungsbaum 

Die vorliegende Erfindung betrifft ein Verfahren zur Erzeu- 
gung eines Bitstroms aus einem Indizierungsbaum sowie ein Co- 
dierverfahren und ein Decodierverfahren, welche von dem Ver- 
fahren zur Erzeugung des Bitstroms Gebrauch machen. Ferner 
betrifft die Erfindung eine Codier- und Decodiervorrichtung . 

Es ist haufig erforderlich^ bestiramte Inhalte aus einem Bit- 
strom entsprechend einer von einem Benutzer vorab getroffenen 
Abfrage auszulesen bzw. hinsichtlich bestimmter Inhalte zu 
ermitteln;r ob diese Inhalte in dem Bit st rem tiberhaupt enthal- 
ten sind. Eine von einem Benutzer definierte Abfrage kann 
hierbei mittels einer Abf ragesprache, wie SQL (siehe Referenz 
[1]) Oder XPATH (siehe Referenz [2]) fonnuliert werden. Es 
ist hierbei vorteilhaft, wenn nicht der gesamte Bitstrom nach 
den gewunschten Inhalten durchsucht werden muss^ sondern wenn 
die Inf ormationen in einer Indizierungsliste oder in einem 
Indizierungsbaiom abgelegt sind^ so dass lediglich der Teil 
des Bitstroms, in dem der Indizierungsbaum bzw. die Indizie- 
rungsliste gespeichert sind, durchsucht werden muss. 

Das Problem des Auslesens von Daten aus einem Bitstrom ergibt 
sich beispielsweise bei einem mit Hilfe der XML-Sprache (XML 
= extensible markup language) erstellten Dokument, das im 
MPEG7-BiM Format reprasentiert wird. Bezilglich des MPEG7-BiM 
Formats eines XML-Dokuments sei hierbei insbesondere auf das 
Dokument [3] verwiesen. Bei einer derartigen Reprasentation 
wird der erzeugte Bitstrom in mehrere Einheiten (access u- 
nits) aufgeteilt, welche ihrerseits wiederum aus mehreren 
Fragmenten (fragment update units) bestehen. Die Einheiten 
werden codiert und bei Bedarf als MPEG7-BiM-Strom an einen 
Oder mehrere Empf anger versandt. 
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In Bezug auf die Abfrage von Inf ormationen aus XML-Dokumenten 
sind bereits eine Vielzahl von Abf ragesprachen bekannt^ die 
es erlauben, nach bestimmten Inf ormationen in deiti Dokiiment zu 
suchen. Beispielhaft sei an dieser Stelle auf die bereits er- 
wahnte Abf ragesprache XPATH (siehe Referenz [2]) verwiesen. 
Mit der Abf ragesprache XPATH k5nnen Auswahlkriterien zur Fil-- 
terung gewtinschter Inf ormationen innerhalb eines XML Doku- 
ments definiert werden. Ziel einer Abfrage kann hierbei ei- 
nerseits die Bewertung sein, ob eine Einheit des Bitstroms 
far den Empf^nger wichtig ist. Andererseits kann mit Hilfe 
einer Abfrage gezielt auf gewUnschte Inf ormationen in dem 
XML-Do kument zurtickgegrif f en werden. Das MPEG7- 
Codierverfahren hat bis jetzt bei der Erzeugung des Bitstroms 
eines XML-Dokiiments keine Mechanismen vorgesehen, die einen 
wahlfreien Zugriff auf bestimmte Elemente des XML-Dokuments 
ermoglichen. Der MPEG7-Bitstrom muss deshalb zur Suche nach 
Element en decodiert werden, Man erhalt dann wieder ein Doku- 
ment im XML-Format, welches mittels der Abf ragesprache XPATH 
durchsucht werden kann. Das Decodieren und anschlieliende Ab- 
arbeiten eines XML-Dokuments zur Suche nach spezifischen In- 
halten ist somit sehr zeitaufwendig und fQr bestimmte zeit- 
kritische Anwendungen unakzeptabel . Ferner kann das Problem 
auftreten, dass der Speicher ±m Decoder begrenzt ist, so dass 
der Bitstrom nicht vollstSndig decodiert wird. Dartiber hinaus 
war der Aufwand des Decodierens unntttig, falls die am deco- 
dierten XML-Dokument durchgefUhrte XPATH-Abf rage negativ ver- 
lauf t . 

Im Rahmen von TV-Anytime (TVA) , das in Dokument [4] beschrie- 
ben ist, wird eine Indexstruktur verwendet, die einen wahl- 
freien Zugriff auf bestimmte Elemente eines Datenf ragmentes 
erlaubt. Die Indexstruktur besteht aus mehreren Teilen und 
umfasst eine sog. Key-Index-L±ste, in der samtliche indizier- 
te Pfade eines Dokumentes abgelegt werden, Bei einer Abfrage 
werden diese Pfade der Reihe nach mit der Abfrage verglichen, 
bis ein entsprechender Eintrag in der Key-Index-Liste gefun- 
den wird. Durch die Inf ormationen, die in der Key-Index-Liste 
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zu diesem Eintrag gespeichert sind, kOnnen die Stellen in ei- 
nem Beschreibungsstrom bestinunt werden, an denen der indi- 
zierte Eintrag codiert vorliegt. Durch die Verwendung der 
Key-Index-Liste ist es nicht mehr erf orderlich, uninteressan- 
te Datenf ragmente zu decodieren^ so dass weniger Speicher- 
platz wShrend einer Abfrage benotigt wird. Das lineare Durch- 
wandern der Key-Index-Liste ist aber zeitkonsumierend und die 
Obertragung aller indizierter Pfade ist aufwendig. 

Aufgabe der Erfindung ist es deshalb, ein Verfahren zur Er- 
zeugung eines Bitstroms aus einem Indizierungsbaiom zu schaf- 
fen, bei dem die Suche nach indizierten Daten einfach und ef- 
fizient erm6glicht wird. 

Diese Aufgabe wird gemaB den Merkmalen der unabh^ngigen Pa- 
ten tansprtiche gelost. Weiterbildungen der Erfindung ergeben 
sich aus den abhangigen i\nspruchen. 

Der Indizierungsbaum^ aus dem mit dem erf indungsgemaJien Ver- 
fahren ein Bitstrom erzeugt wird, umfasst eine Mehrzahl von 
Hierarchieebenen, wobei jeder Hierarchieebene ein oder mehre- 
re Indexknoten zugeordnet sind und die Indexknoten Indexdaten 
enthalten, die in dem Indizierungsbaum nach einem oder mehre- 
ren vorgegebenen Kriterien sortiert sind. Bei dem erfindungs- 
gemSBen Verfahren werden die Indexdaten der Indexknoten in 
den Bitstrom eingefagt und ferner wird ftir einen Indexknoten 
jeweils die Information in den Bitstrom eingefUgt, an welcher 
Stelle im Bitstrom sich die Indexdaten von einem oder mehre- 
ren Indexknoten der Hierarchieebene, die unterhalb der Hie- 
rarchieebene des jeweiligen Knot ens liegt, befinden. Durch 
die Speicherung der zusStzlichen Information bezuglich der 
Indexknoten in einer darunter liegenden Hierarchieebene wird 
eine Suche nach bestimmten Indexdaten wesentlich vereinfacht, 
da hierdurch Sprunge zu den far die Suche relevanten Index- 
knoten ermoglicht \>rerden. Somlt wird eine wesentlich effi- 
zientere Abfrage und Suche nach Indexdaten gewahrleistet . 
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In einer bevorzugten Ausfiihrungsf orm ist der Indizierungsbatim 
als sog. B-Tree (= Balanced Tree) aufgebaut, der eine ausge- 
glichene Verteilung der Daten auf die Knoten des Baums ge- 
wahrleistet. Eine genaue Beschreibung des B-Trees findet sich 
5 in der Referenz [5] . 

Die Indexdaten in dem Indizierungsbaum k5nnen nach beliebigen 
Kriterien sortiert sein, beispielsweise lexikographisch. 

10 In einer besonders bevorzugten Ausfiihrungsf orm sind die In- 
dexdaten nach der Depth-First— Ordnung in den Bitstrom einge- 

•ftigt. Durch die Verwendung der Depth-First-Ordnung werden die 
Indexdaten in dem Indizierungsbaum zunachst der Tiefe nach in 
den Bitstrom eingeftlgt, wodurch die fttr eine Abfrage relevan- 
15 ten Informationen im Bitstrom benachbart zueinander angeord- 
net werden und nicht relevante Informationen effizient tiber- 
sprungen werden k5nnen. Eine genaue Beschreibung der Depth- 
First-Ordnung findet sich in der Referenz [6] . 

20 In einer weiteren bevorzugten Ausfiihrungsf orm der Erfindung 
umfassen die Indexdaten Pfade eines Dokumentenstrukturbaums, 
der einen Wurzelknoten und eine Mehrzahl von Blatt knoten um- 
fasst. Ferner umfassen die Indexdaten vorzugsweise die Werte- 
auspragungen der Pfade und die Positionen der Werteausprfigun- 

• gen in dem Dokument, das durch den Dokumentenstrukturbauifi 
dargestellt ist. Dartiber hinaus lomfassen die Indexdaten in 
einer bevorzugten AusfUhrungsf oinn auch noch die Anzahl der 
Pfade in einem Indexknoten. 

30 Die Pfade konnen hierbei Absolutpfade sein^ die von dem Wur- 
zelknoten des Dokumentenstrukturbaums beginnen und zu einem 
Blatt knoten des Dokumentenstrukturbaums fiihren. In einer be- 
sonders bevorzugten Ausfiihrungsf orm der Erfindung sind die 
Pfade jedoch relative Pfade, wobei ein relativer Pfad eines 

35 jeweiligen Indexknotens ein Pfad relativ zu einem zuvor in 
den Bitstrom eingefiigten Pfad des jeweiligen Indexknotens 
Oder eines Indexknotens einer liber der Hierarchieebene des 
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jeweiligen Indexknotens liegenden Hierarchieebene ist. Durch 
die Verwendung von relativen Pfaden warden Gemeinsamkeiten in 
den Pfaden ausgenutzt^ denn die Pfade von benachbarten Knoten 
haben meist einen gemeinsamen Anteil. Auf diese Weise kann 
der benotigte Speicherbedarf fur die Indexdaten im Bitstrom 
reduziert werden. Eine weitere Reduzierung des Speicherbe- 
darfs kann dadurch erreicht werden^ dass die Pfade des Index- 
knotens/ dessen Indexdaten als erste einer Hierarchieebene in 
den Bitstrom eingefugt werden, in einer Reihenfolge liitigekehrt 
zu der Reihenfolge, in der die Indexdaten in dem Indexknoten 
angeordnet sind, in den Bitstrom eingeftigt werden. Hierbei 
wird die Tatsache berticksichtigt, dass die Indexdaten am Ende 
des ersten Indexknotens einer Hierarchieebene eine grOfiere 
Ahnlichkeit zu dem Indexknoten der nSchsthaheren Hierarchie- 
ebene aufweisen als die Indexdaten am Anfang des ersten In- 
dexknotens. Folglich ergibt sich in bestimm±:en Fallen eine 
besonders effektive Codierung mittels von relativen Pfaden. 

In einer besonders bevorzugten Ausf lihrungsf orm der Erfindung 
umfassen die Pfade Beschreibungselemente eines XML-Dokuments 
(XML = extensible markup language) , wobei die Pfade insbeson- 
dere XPATH-Pfade des XML-Dokuments sind. 

In einer weiteren Ausf Uhrungs form der Erfindung sind die In- 
dexdaten mit einem Codierverf ahren binSr codiert, insbesonde- 
re mit einem MPEG-Codierverf ahren. In einer besonders bevor- 
zugten Ausfuhrungsform wird als Codierverf ahren das MPEG7- 
Codierverf ahren verwendet . 

Neben dem oben beschriebenen Verfahren zur Erzeugung eines 
Bitstroms umfasst die Erfindung ferner ein Verfahren zum Co- 
dieren einer Datenstruktur^ bei dem die Datenelemente der Da- 
tenstruktur in einem Indizierungsbaum indiziert sind^ wobei 
ein Bitstrom gemSB dem erf indungsgemalien Verfahren erzeugt 
wird und dieser Bitstrom Teil des codierten Datenstroms ist. 
Dariiber hinaus umfasst die Erfindung ein Verfahren zum Deco- 
dieren einer Datenstruktur, wobei das Verfahren derart aus- 
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gestaltet ist, dass eine mit deiti soeben beschriebenen Codier- 
verfahren codierte Datenstruktur decodiert wird. 

Daruber hinaus umfasst die Erfindung ein Verfahren zum Codie- 
5 ren und Decodieren einer Datenstruktur^. welches das oben be- 
schriebene Codierverf ahren und Decodierverf ahren umfasst. 

Die Erfindung lomfasst auch eine Codiervorrichtung, mit der 
das erfindungsgemSlie Codierverf ahren durchfahrbar ist^ sowie 
10 eine Decodiervorrichtung^ mit der das erfindungsgemSBe Deco- 
dierverf ahren durchfahrbar ist. Ferner betrifft die Erfindung 
^ eine entsprechende Vorrichtung zum Codieren und Decodieren^ 
V mit der das oben beschriebene kombinierte Codier- und Deco- 
dierverf ahren durchfahrbar ist- 

15 

Ausfahrungsbeispiele der Erfindung werden nachfolgend anhand 
der Zeichnungen dargestellt und erlSutert. 

Es zeigen 

20 

Fig.l ein Beispiel eines in dem erf indungsgemafien Verfahren 
verwendeten Indizierungsbaums; 



Fig.2 einen Ausschnitt aus dem in Fig, 1 gezeigten Indizie- 
rungsbaum; 

Fig. 3 einen Ausschnitt aus einem Bitstrom, der aus dem In- 
dizierungsbaum der Fig. 1 mit dem erf indungsgemafien 
Verfahren generiert wurde; 

30 

Fig. 4 einen vereinf achten Indizierungsbaum,. in dem die In- 
dexdaten lexikographisch geordnet sind und Pfade ei- 
nes Dokumentenstrukturbaums darstellen; 



35 



Fig. 5 



den Indizierungsbaum der Fig. 4^ wobei die Pfade der 
zweiten Hierarchieebene teilweise als relative Pfade 
dargestellt sind; 
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Fig. 6 den Indizierungsbaiim der Fig. 4^ wobei alle Pfade der 
zweiten Hierarchieebene als relative Pfade darge- 
stellt sind; und 



Fig. 7 eine Abwandlung des Indizierungsbaums gemaB Fig. 4. 

Figur 1 zeigt beispielhaft einen in dem erf indungsgemaBen 
Verfahren verwendeten Indizierungsbaijm. Es handelt sich bei 
diesem Baum ma einen sog. B-Baum (B steht ftir Balanced) , wel- 
cher haufig bei der Indizierung von Daten zur Anwendung 
koirant. Die Struktur eines B-Bainns ist beispielsweise in der 
bereits erwahnten Referenz [5] beschrieben. Der B-Ba\am weist 
eine ausgeglichene Struktur auf und ermOglicht hierdurch ein 
Suchen mit einem gemessen an der Zahl der Eintrage nur loga- 
rithitiischen Aufwand^ wohingegen beiiti Suchen mit einer Liste 
ein linearer Auf wand erforderlich ist. 

Der Indizierungsbaum enthalt eine Mehrzahl von Knot en 1 bis 
10, wobei in jedem Knoten eine oder mehrere Indexdaten in 
Form von sog. Schliisseln gespeichert sind. Im vorliegenden 
Fall sind die Indexdaten sog. XPATH-Pfade eines Beschrei- 
bungsbaums eines XML-Dokuments. Eine Beschreibung von XPATH- 
Pfaden findet sich in der bereits erwahnten Referenz [2] • Die 
XPATH-Pfade fuhren von dem Wurzelknoten des Beschreibungs- 
baums des XML-Dokuments zu den einzelnen Blattknoten des Be- 
schreibungsbaiams des XML-Dokuments • Es werden in dem in die- 
ser AusfUhrungsfoiiti verwendeten Beschreibungsbaum als Blatt- 
knoten XML-Elemente mit einfachem Inhalt und alle XML- 
Attribute verwendet. Folglich umfassen die Indexdaten des in 
Figur 1 gezeigten Indizierungsbaxjms Wurzel-Blatt-Pf ade eines 
XML-Beschreibungsbaums . 

Die XPATH-Pfade sind in dem Indizierungsbaum der Fig. 1 als 
eine Reihe aus Grofi- und Kleinbuchstaben dargestellt und le- 
xikographisch geordnet, wobei jeder Buchstabe fur einen Ele- 
mentnamen in dem XML-Beschreibungsbaum steht. Beispielsweise 
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bedeutet der Pfad MDMVUFACN in Knoten 1 MPEG7 /Description/ 
MultimediaContent/Video/Usagelnfontiation/FinancialResults/ 
Account Item/Costtype/Name. Neben dem Pfad sind in den Knoten 
auch die Werteauspragungen gespeichert, in denen dieser Pfad 
5 in dem XML-Dokument auftritt. Im vorliegenden Fall tritt der 
Pfad MDMVUFACN im Indexknoten 1 zweimal mit den Auspragungen 
"Total for Production" und "Broadcast" auf . Demgegeniiber 
tritt beispielsweise der Pfad MDMVUAFAc im Indexknoten 2 nur 
einmal mit der Auspragung "EUR" auf. 

10 

Die Nuramerierung der Indexknoten in dem Indizierungsbaum der 
Figur 1 entspricht der Reihenfolge, in welcher die Indexdaten 
mit Hilfe des erf indungsgemafien Verfahrens in den Bitstrom 
eingefUgt werden. Die Reihenfolge entspricht hierbei einer 
15 sog. Depth- First-Ordnung, die beispielsweise in der bereits 
erwahnten Referenz [6] beschrieben ist. Durch das Einfugen 
der Indexdaten in den Bitstrom gemSJS der Depth- Fir st-Ordnung 
ergibt sich eine geringere Komplexitat beim Zugriff auf die 
Indexdaten^ da bei der Suche nach Indexdaten nicht relevante 
20 Inf ormationen ubersprungen werden. 

In Figur 2 ist ein Ausschnitt aus dem Indizierungsbaum der 
Figur 1 gezeigt, an dem an einem Beispiel die Abfrage von In- 
dexdaten in diesem Baum erlautert wird. Es handelt sich hier- 

•bei um die Abfrage, ob der XPATH-Pfad MPEG7/Description/ 
Multimediacontent/Video/Usagelnformation/Availability/ 
Dissemination/Disseminator/Agent/Name die Werteauspragung 
"Discovery" enthait (in Kurzschreibweise MDMVUADDAN = "Disco- 
very") . Da der Suchstring MDMVUADDAN lexikographisch kleiner 
30 ist als der XPATH-Pfad "MDMVUFACN" des Indexknotens 1 wird 
auf den Indexknoten 2 zurtlckgegrif f en. Der Suchstring ist 
wiederum lexikographisch kleiner als der Eintrag "MDMVUAFAc" 
des Indexknotens 2. Deshalb wird auf den links des Indexkno- 
tens 2 gelegenen Indexknoten 3 tibergegangen. Dieser Indexkno- 
35 ten enthalt zwei XPATH-Pfade "MDMVUAAt" und "MDMVUADFh". Der 
Suchstring liegt zwischen diesen beiden XPATH-Pf aden, so dass 
in der nachsten Hierarchieebene auf den zwischen Indexknoten 
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4 und Indexknoten 6 liegenden Indexknoten 5 ubergegangen 
wird. Dieser Indexknoten enthalt nunmehr als erstes Element 
den gesuchten XPATH-Pfad "MDMVUADDAN^^ sowie die gesuchte Wer- 
teauspragung "Discovery". Es wurde somit in dem Indexknoten 5 
die passende Werteauspragung gefunden und man erhalt dann die 
Position des entsprechenden Element es im indizierten XML- 
Dokument. Dadurch, dass die Indexknoten in den Bitstrom gemaB 
der Depth-First -Or dnung eingefugt sind, warden alle weiteren 
Knoten des Indizierungsbaioms bei der Suche ignoriert bzw. 
tibersprungen, so dass die Suche nach Elementen im Indizie- 
rungsbaum geringe Komplexitat aufweist. 

Im folgenden wird detailliert auf die Einftigung der Indexda- 
ten in den Bitstroms mittels des erf indungsgemSfien Verfahrens 
eingegangen. Dies geschieht anhand der Figur 3^ welche einen 
Ausschnitt aus einem mit dem erf indungsgemaBen Verfahren er- 
zeugten Bitstrom darstellt. In dem in Figur 3 gezeigten Bit- 
strom sind ubersichtshalber die Nummern der Indexknoten auf- 
gefiihrt, wobei diese Nummern jedoch nicht mit dem Strom u- 
bermittelt werden. Im Detail sind in Figur 3 die Inhalte der 
Indexknoten 1 und 3 gezeigt. Die Knoten enthalten als erstes 
Element zunachst die Anzahl der Eintrage, d.h. die Anzahl der 
in dem Knoten gespeicherten XPATH-Pfade. Ftir den Indexknoten 
1 ergibt sich hier die Zahl 1 und ftir den Indexknoten 3 die 
Zahl 2. AnschlieBend folgt ftir jeden Eintrag der Schlussel, 
d.h. der jeweilige XPATH-Pfad sowie die Anzahl der Instanzi- 
ierungen^ d.h. die Anzahl der WerteausprSgungen, die dieser 
XPATH-Pfad in dem XML-Do kument hat. Ftir den Indexknoten 1 er- 
gibt sich beispielsweise ftir den XPATH-Pfad "MDMVUAFCN" die 
Instanziierungsanzahl 2, da der Pfad mit den beiden Werteaus- 
pragungen "Total for Production" und "Broadcast" in dem XML- 
Do kument auftritt. Fur jede Werteauspragung wird ferner die 
Position dieser Werteauspragung in dem XML-Dokument in den 
Bitstrom eingefugt. Es ist bei dem erf indungsgemafien Verfah- 
ren wesentlich^ dass neben diesen Inf ormationen ferner in den 
Bitstrom die Information eingefugt wird, an welcher Position 
im Bitstrom - insbesondere an welcher Position relativ zur 
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momentanen Position (offset) - sich die Indexdaten von mit 
deia jeweiligen Indexknoten verbundenen Indexknoten der darun- 
ter liegenden Hierarchieebene befinden. Hierdurch wird das 
Oberspringen von Knoten ermoglicht^ die fUr eine vorgegebene 
Suchabfrage nicht relevant sind. 

Im folgenden bezeichnet man die sich von einem Knoten in eine 
tiefer liegende Hierarchieebene verzweigenden Knoten als 
Kindknoten. Es ist bei dem erf indungsgemSBen Verfahren zu be- 
achten, dass die Information bezUglich der Position des ers- 
ten Kindknotens einer Hierarchieebene nicht gespeichert wer- 
den muss,, da dieser Kindknoten im Bitstrom als nachster ein- 
gelesen wird. Wie der Figur 3 entnommen werden kann, werden 
somit fur den Indexknoten 1 lediglich die Position des Index- 
knotens 10 (als "offset (10)" bezeichnet) und ftir den Index- 
knoten 3 lediglich die Positionen der Indexknoten 5 und 6 
(bezeichnet als "offset (5)" und "offset (6)") gespeichert. Er- 
gibt sich beispielsweise,. dass die gesuchte Information bei 
einer Abfrage lexikographisch groBer als der XPATH in Knoten 
1 ist, wird sofort ztom Knoten 10 gesprungen, so dass es nicht 
mehr notwendig ist, den Indexknoten 2 und die sich von dem 
Indexknoten 2 verzweigenden Indexknoten zu durchsuchen. Hier- 
durch wird eine effektive Suche erm5glicht. 

In der nachf olgenden Tabelle ist nochmals aufgefUhrt, welche 
Informationen pro Knoten in dem Bitstrom gespeichert werden. 
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Tabelle: 



Knot en { 

T^zahl der EintrSge 
fur jeden Eintrag: 
Schltissel 

Anzahl der Instanziierungen 
fiir jede Instanziierung: 

Werteauspragung 

Position 

fur jeden Kindknoten auBer den ersten 
Offset im Strom 



Der itiit dem erf indungsgemafien Verfahren erzeugte Bitstrom 
wird an den Empfanger ubermittelt und kann entsprechend einer 
Abfrage, die beispielhaft in Bezug auf Figur 2 erlautert wur- 
de;^ ausgelesen werden, Durch Vergleiche zwischen dem abzufra- 
genden XPATH und den Eintragen in den Indexknoten werden so 
lange bestimmte Knoteninf ormationen aus dem Strom ausgelesen, 
bis der entsprechende gesuchte XPATH mit der gesuchten Werte- 
auspragung gefunden wurde oder bis kein passender XPATH^-Pfad 
aufgrund der Sortierung mehr m5glich ist. Im letzteren Fall 
ist die gewunschte Information im indizierten Dokument nicht 
enthalten. 

Im folgenden werden anhand der Figuren 4 bis 1 , welche ver- 
einfachte IndizierungsbSume mit lexikographisch geordneten 
Eintrage darstellen,. weitere Ausftihrungsf ormen des erfin- 
dungsgemaJBen Verfahrens erlautert. In Figur 4 ist ein mittels 
des erf indungsgemalien Verfahrens zu codierender Indizierungs- 
baum gezeigt, der Knoten Kl bis K4 umfasst. Der Knoten Kl 
wird hierbei als Vaterknoten bezeichnet und die sich aus dem 
Knoten Kl verzweigenden Knoten K2 bis K4 werden als Kindkno- 
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ten bezeichnet. Bei den Eintragen handelt es sich urn Pfade 
eines Dokioiaentenstrukturbaiains • Statt im Bitstrom die Pfade 
mit ihrer gesamten Lange zu libertragen, besteht die Moglich- 
keit, sog. relative Pfade in dem zu iibertragenden Indexknoten 
abzuspeiche^rn, wobei diese Pfade relativ in Bezug auf einen 
im vorangegangenen ubertragenen Pfad des Vaterknotens bzw. in 
Bezug auf einen im vorangegangenen ubertragenen Pfad des mo- 
mentan zu ubertragenden Indexknotens sind. 



10 Die Einfugung von relativen Pfaden in den Bitstrom ist in Fi- 
gur 5 verdeutlicht . Hierbei bedeutet die Darstellung ei- 

•nen Schritt zurUck in dem Pfad, auf den sich der relative 
Pfad bezieht. In dem Knoten Kl wird fur den Eintrag "AE" der 
relative Pfad "..E" in Bezug auf den vorangegangenen Eintrag 
15 ACB tibertragen. In den Kindknoten Kl, K2 und K3 werden je- 

weils in den zweiten und dritten Eintragen die relativen Pfa- 
de in Bezug auf den ersten Pfad des jeweiligen Kindknotens 
abertragen . 

20 Bei der Ausf lihrungsf orm der Figur 5 wird fur die ersten Pfade 
AA, ACC bzw. AEF der Kindknoten K2, K3 bzw. K4 der komplette 
absolute Pfad abertragen. Es ist nun zusStzlich moglich, auch 
die ersten Pfade der Kindknoten als relative Pfade in Bezug 
auf einen Pfad des Vaterknotens Kl zu tibertragen. Dies ist in 

• Figur 6 dargestellt. Anstatt der Pfade AA und ACC der ersten 
und zweiten Kindknoten werden hierbei die relativen Pfade 
"..A" und ".C" in bezug auf den ersten Pfad des Vaterknotens 
abertragen. Anstatt des Pfads "AEF" des dritten Kindknotens 
wird der relative Pfad "F" in bezug auf den zweiten Pfad des 
30 Vaterknotens abertragen. Die Pfade werden hierbei vorzugswei- 
se in ihrer Bytedarstellung in den Bitstrom abgelegt. 

Durch die Verwendung von relativen Pfaden wird das Datenvolu- 
men im Strom stark verringert,. da bei der Abspeicherung der 
35 Pfade Gemeinsamkeiten in den Pfaden ausgenutzt werden^ so 

dass weniger Speicherplatz benotigt wird. Insbesondere mttssen 
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bei relativen Pfaden die jeweiligen gemeinsamen Anteile der 
Pfade nur einmal tibermittelt warden . 

In einer weiteren Ausf iihrungsf orm der Erfindung wird eine Da- 
tenersparnis dadurch erreicht, dass bei der Anordnung der 
Eintrage der Indexknoten fur den ersten Kindknoten K2 eine 
gegenuber der Figur 4 umgekehrte Reihenfolge verwendet wird. 
Hierdurch wird erreicht, dass der Eintrag^ der die grSBte 
Ahnlichkeit zu dem vorangegangenen Vaterknoten Kl aufweist,. 
am Anfang des Kindknotens K2 steht. Damit konnen sich bei 
speziellen Ausgestaltungen des Indizierungsbaxoms wesentlich 
verkurzte relative Pfade und ein verringerter Speicherbedarf 
ergeben. 

Die Pfade kOnnen die bereits im vorangegangenen erwahnten 
XPATH-Pfade eines XML-Beschreibungsbauins sein. Ferner konnen 
die Pfade binar codiert sein^ beispielsweise mit einem MPEG7 
Codierverfahren. Insbesondere konnen die in der bereits er- 
wahnten Referenz [3] spezif izierten Verfahren zur Binarcodie 
rung eingesetzt werden. Der Einsatz von binar codierten Pfa- 
den kann im Vergleich zu textuellen Reprasentationen zu Ein- 
sparungen bei der Anzahl der zu Obermittelnden Bits ftthren. 
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PatentansprQche 



1. Verfahren zur Erzeugung eines Bitstroms aus einem Indi- 
zierungsbauiRi. wobei der Indizierungsbaum eine Mehrzahl 
von Hierarchieebenen umfasst und jeder Hierarchieebene 
ein Oder mehrere Indexknoten (Kl, K2, K3, K4) zugeordnet 
sind, wobei die Indexknoten (Kl^ K2^ K4) Indexdaten 
enthalten, die in dem Indizierungsbaum nach einem oder 
mehreren vorgegebenen Kriterien sortiert sind, bei dem: 

- die Indexdaten der Indexknoten (Kl, K2, K3, K4) in den 
Bit Strom eingefagt werden; 

- ftlr einen Indexknoten jeweils die Information in den 
Bitstrom eingeftigt wird, an welcher Stelle im Bitstrom 
sich die Indexdaten von einem oder mehreren Indexkno- 
ten (Kl, K2r K3, K4) der Hierarchieebene;- die unter- 
halb der Hierarchieebene des jeweiligen Knotens liegt, 
bef inden. 

2. Verfahren nach Anspruch 1, bei dem der Indizierungsbaum • 
ein B-Tree (= Balanced Tree) ist. 

3- Verfahren nach Anspruch 1 oder 2, bei dem die Indexdaten 
in dem Indizierungsbaum lexikographisch sortiert sind. 

4. Verfahren nach einem der vorhergehenden Ansprviche, bei 
dem die Indexdaten nach der Depth-First-Ordnung in den 
Bitstrom eingefugt werden - 

5- Verfahren nach einem der vorhergehenden Anspriiche^ bei 
dem die Indexdaten Pfade eines Dokumentenstrukturbaums 
bestehend aus mindestens einen Wurzelknoten und eine 
Mehrzahl von Blattknoten umfassen. 



6. 



Verfahren nach Anspruch 5 , bei dem die Indexdaten die 
Werteauspragungen der Pfade und die Positionen der Werte- 
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auspragungen in dem Dokument, das durch den Dokiimenten- 
strukturbaum dargestellt ist^ enthalten, 

7. Verfahren nach Anspruch 5 oder 6, bei dem die Indexdaten 
5 die Anzahl der Pfade in einem Indexknoten {Kl^ K2, K3, 

K4) lomfassen. 

8. Verfahren nach einem der Ansprtiche 5 bis 1, bei dem die 
Pfade absolute Pfade umfassen, die von dem Wurzelknoten 

10 beginnen und zu einem Blattknoten fiihren. 

9. Verfahren nach einem der Ansprtiche 5 bis 8, bei dem die 
Pfade relative Pfade umfassen, wobei ein relativer Pfad 
eines jeweiligen Indexknotens (Kl, K2, K3, K4) ein Pfad 

15 relativ zu einem zuvor in den Bitstrom eingeftigten Pfad 

des jeweiligen Indexknotens (Kl^ K2, K3, K4) oder eines 
Indexknotens (Kl, K2, K3, K4) einer uber der Hierarchies 
ebene des jeweiligen Indexknotens (Kl, K2, KB, K4) lie- 
genden Hierarchieebene ist, 

20 

10. Verfahren nach Anspruch 9, bei dem die Pfade des Index- 
knotens, dessen Indexdaten als erste einer Hierarchieebe- 
ne in den Bitstrom eingeftigt werden, in einer Reihenfolge 
xomgekehrt zu der Reihenfolge, in der die Indexdaten in 
dem Indexknoten (Kl, K2, K3, K4) angeordnet sind, in den 
Bitstrom eingeftigt werden. 

11. Verfahren nach einem der Ansprtiche 5 bis 10, bei dem die 
Pfade Beschreibungselemente eines XML-Dokxoments (XML = 

30 Extensible Markup Language) umfassen - 

12. Verfahren nach Anspruch 11, bei dem die Pfade XPATH-Pfade 
des XML-Dokuments sind. 



35 



Verfahren nach einem der vorhergehenden Ansprtiche, bei 
dem die Indexdaten mit einem Codierverf ahren binar co- 
diert sind, insbesondere mit einem MPEG-Codierverf ahren. 
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14. Verfahren nach Anspruch 13, bei dem das Codierverf ahren 
ein MPEG7 -Codierverf ahren ist. 

15- Verfahren zum Codieren einer Datenstruktur, bei dem die 

Datenelemente der Datenstruktur in einem Indizierungsbaiim 
indiziert sind, wobei ein Bitstroiti gemafi einem der vor- 
hergehenden Anspriiche erzeugt wird und der Bitstrom Teil 
des codierten Datenstroms ist. 

16. Verfahren zum Decodieren einer Datenstruktur, wobei das 
Verfahren derart ausgestaltet ist, dass die gemaii An- 
spruch 12 codierte Datenstruktur decodiert wird. 

17. Verfahren zum Codieren und Decodieren einer Datenstruk- 
tur, umfassend das Verfahren nach Anspruch 15 und das 
Verfahren nach Anspruch 16. 

18. Codiervorrichtung, mit der ein Verfahren nach Anspruch 15 
durchftihrbar ist. 

19. Decodiervorrichtung mit der ein Verfahren nach Anspruch 
16 durchftihrbar ist- 



20. 



Vorrichtung zum Codieren und Decodieren einer Datenstruk- 
tur, mit der ein Verfahren nach Ttospruch 17 durchftihrbar 
ist. 
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Zusaramenfassung 

Verfahren zur Erzeugung eines Bitstroms aus einem Indizie- 
rungsbaxrai 

Die Erfindung betrifft ein Verfahren zur Erzeugung eines Bit- 
stroms aus einem Indizierungsbaum, wobei der Indizierungsbaum 
eine Mehrzahl von Hierarchieebenen umfasst und jeder Hierar- 
chieebene ein oder mehrere Indexknoten zugeordnet sind, wobei 
die Indexknoten Indexdaten enthalten, die in dem Indizie- 
rungsbaum nach einem oder mehreren vorgegebenen Kriterien 
sortiert sind. In dem Verfahren werden die Indexdaten der In- 
dexknoten in den Bitstrom eingefUgt und fQr einen Indexknoten 
wird jeweils die Information in den Bitstrom eingeftigt, an 
welcher Stelle im Bitstrom sich die Indexdaten von einem oder 
mehreren Indexknoten der Hierarchieebene, die unterhalb der 
Hierarchieebene des jeweiligen Knot ens liegt, befinden. 



Figur 1 




Fig. 1 
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